Un modèle générique d'organisation de corpus en ligne: application à la FReeBank

نویسندگان

  • Susanne Salmon-Alt
  • Laurent Romary
  • Jean-Marie Pierrel
چکیده

The few available French resources for evaluating linguistic models or algorithms on other linguistic levels than morpho-syntax are either insufficient from quantitative as well as qualitative point of view or not freely accessible. Based on this fact, the FREEBANK project intends to create French corpora constructed using manually revised output from a hybrid Constraint Grammar parser and annotated on several linguistic levels (structure, morphosyntax, syntax, coreference), with the objective to make them available on-line for research purposes. Therefore, we will focus on using standard annotation schemes, integration of existing resources and maintenance allowing for continuous enrichment of the annotations. Prior to the actual presentation of the prototype that has been implemented, this paper describes a generic model for the organization and deployment of a linguistic resource archive, in compliance with the various works currently conducted within international standardization initiatives (TEI and ISO/TC 37/SC 4). MOTS-CLÉS : ressources linguistiques, annotation multi-niveau, normalisation, ressources

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Conception objet dans le cadre des systèmes d'information spatiaux: Agrégation spatiale et généralisation

Notre propos est de témoigner de l'apport du paradigme objet et notamment du formalisme UML dans l'élaboration et la confrontation de modèles conceptuels. Traitant des problèmes de gestion de l'espace rural, nous portons notre attention sur les notions de représentation du paysage. En particulier, nous précisons l'intérêt du concept d'agrégation utilisé à des fins structurelles et dynamiques. N...

متن کامل

Evolutivité des applications Web: un méta-modèle exécutable

RESUME. Les processus de développement pilotés par le modèle ont été pensés avec in fine l'objectif d'une évolution régulière et incrémentale. Peu d'outillage pourtant existe afin de supporter la coévolution des modèles et de leur méta-modèle. De nombreux travaux s'intéressent au développement piloté par le modèle des applications Web centrées sur les données, mais peu parmi ceux-ci s'intéresse...

متن کامل

Sémantique et réutilisation d'ontologie générique

Dans ce papier, nous enrichissons la méthode Terminae de construction d'ontologie à partir de textes en proposant une semi-automatisation de la construction du modèle conceptuel. Nous présentons un algorithme permettant la conceptualisation d'un terme en s'appuyant sur les informations linguistiques contenues dans l'ontologie générique de référence.

متن کامل

Analyse spatiotemporelle des vecteurs de mouvement : application au comptage des personnes

Résumé. Cet article présente une nouvelle approche qui permet de compter le nombre d’individus franchissant une ligne de comptage . L’approche proposée accumule dans le temps les vecteurs de mouvement pour chaque point de la ligne de comptage formant une carte spatiotemporelle. Une procédure de détection en ligne des blobs est ensuite utilisée afin de déterminer les régions de la carte spatiote...

متن کامل

Diagnostic multi-sources adaptatif. Application à la détection d'intrusion dans des serveurs Web

Résumé. Le but d’un système adaptatif de diagnostic est de surveiller et diagnostiquer un système tout en s’adaptant à son évolution. Ceci passe par l’adaptation des diagnostiqueurs qui précisent ou enrichissent leur propre modèle pour suivre au mieux le système au fil du temps. Pour détecter les besoins d’adaptation, nous proposons un cadre de diagnostic multi-sources s’inspirant de la fusion ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • CoRR

دوره abs/cs/0611026  شماره 

صفحات  -

تاریخ انتشار 2005